Um SGBD com Armazenamento Distribuído de Dados Baseado em DHT

نویسندگان

  • Eduardo A. Ribas
  • Roney Uba
  • Ana Paula Reinaldo
  • Arion de Campos
  • Davi Arnaut
  • Carmem S. Hara
چکیده

This paper investigates the development of a DHT-based storage engine for a database management system (DBMS). The storage engine is responsible for implementing the interface between an SQL query processor and a DHT, by translating operations based on relations to DHT standard operations. By combining DHTs to DBMSs we achieve scalability, decentralization, and fault tolerance, due to a DHT-based relational storage, and also a general high level language for querying data stored on DHTs. Our experimental study shows some initial results on two issues. The first determines the impact of developing an indexing structure on top of a DHT for processing range queries. The second investigates two approaches for mapping relations to DHT’s key-value pairs: vertical and horizontal partition of relations. Resumo. Este artigo apresenta o desenvolvimento de um módulo de armazenamento baseado em Tabelas de Espalhamento Distribuı́das (DHT) para um Sistema Gerenciador de Banco de Dados (SGBD). O módulo integra a máquina SQL com a DHT, traduzindo para o formato de utilização da DHT as operações de inclusão, leitura, atualização e remoção de dados estruturados em forma de tabelas. Unindo as propriedades da DHT às propriedades do banco de dados, é possı́vel desenvolver um sistema altamente escalável, descentralizado, tolerante a falhas e que seja de fácil utilização para o armazenamento de dados no modelo relacional. São apresentados resultados de dois experimentos. O primeiro tem por objetivo determinar o impacto de uma estrutura de indexação sobre a DHT para o processamento de consultas por intervalo de valores. O segundo investiga duas formas de realizar o mapeamento entre o modelo relacional e o modelo chave-valor, utilizado pelas DHT: a fragmentação horizontal e a fragmentação vertical de tabelas.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Projeto de banco de dados de simulações numéricas

Resumo. Com a rápida evolução dos sistemas computacionais, simulações numéricas baseadas em modelagem computacional têm alcançado soluções cada vez mais realistas. Ainda assim, o processo de simulação é complexo, exigindo grande capacidade computacional e produzindo muitos arquivos auxiliares com os resultados das simulações. Uma grande quantidade de arquivos, como os produzidos durante o proce...

متن کامل

Uma Abordagem para Armazenamento de Dados Semi-Estruturados em Bancos de Dados Relacionais

This paper presents an approach to storing semistructured data in relational databases. We focus on semistructured data as extracted from Web pages by a tool called DEByE (Data Extraction By Example), and organized according to its data model, the DEByE Object Model (DEByE-OM). The approach presented here consists in representing the structure of objects extracted by DEByE by a relational schem...

متن کامل

Uso de SGBDs NoSQL na Gerência da Proveniência Distribuída em Workflows Científicos

Resumo. Um fator fundamental na gerência de experimentos modelados como workflows científicos são seus dados de proveniência. Esses dados basicamente são usados para garantir a reprodutibilidade, porém nos últimos anos eles também vêm sendo usados para tarefas de monitoramento e escalonamento de atividades. Como essas tarefas demandam consultas em tempo real, conforme a quantidade de dados de p...

متن کامل

Reindexação Automática em SGBDs Relacionais

We propose a solution to the automatic and online reindex problem. The proposed mechanism runs continuously and with almost no human intervention. The adopted strategy is based on ad-hoc heuristics that monitor the index fragmentation level and, when necessary, reindex it automatically. We have actually implemented our ideas within the PostgreSQL DBMS code. Practical performance tests show the ...

متن کامل

Modelagem de Tráfego VoIP Utilizando Misturas Gaussianas Ajustadas por Algoritmo de Maximização de Esperança e Comprimento de Descrição Mínimo

Resumo: O aumento do número de aplicações que geram tráfego VoIP (Voice over IP) requer que modelos adequados para este tipo de tráfego sejam empregados para um melhor dimensionamento dos recursos da rede. Neste artigo, propomos a aplicação de Misturas Gaussianas ajustadas por um algoritmo EM (Expectation − Maximization) com seleção de número de classes utilizando o princípio do Comprimento de ...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2010